近期,360創(chuàng)始人周鴻祎對互聯(lián)網(wǎng)圈進行了評論:在ChatGPT領(lǐng)域,美國超過了我們,中國公司和科研人員需要加速追趕。
ChatGPT的興起引起了國內(nèi)外互聯(lián)網(wǎng)公司的關(guān)注。為了應(yīng)對ChatGPT的挑戰(zhàn),谷歌在2月8日緊急推出了人工智能聊天機器人Bard。國內(nèi)的百度宣布將于3月初推出“文心一言”,其他互聯(lián)網(wǎng)公司也紛紛效仿。
截至2月10日,已經(jīng)宣布擁有類似ChatGPT技術(shù)儲備、準備發(fā)布和已經(jīng)發(fā)布類ChatGPT產(chǎn)品服務(wù)的國內(nèi)大廠包括:阿里巴巴、騰訊、華為、字節(jié)跳動、京東、360、科大訊飛、快手、網(wǎng)易有道等,超過10家互聯(lián)網(wǎng)巨頭紛紛進入了熱門的ChatGPT領(lǐng)域。
小型科技公司正在跟風熱度,大型公司也并非輕松控制ChatGPT。比如谷歌Bard發(fā)布時,演示視頻中犯了一個事實錯誤,導(dǎo)致谷歌股價大跌,目前市值已經(jīng)下降了1700億美元。
1.扎堆入局ChatGPT競賽
在搜索和AI領(lǐng)域積累最深的百度,自然被市場寄予厚望。
百度,作為在搜索和AI領(lǐng)域積累最深的公司,在市場上擁有很高的期望。計劃在今年三月推出一款類似于ChatGPT的人工智能聊天機器人服務(wù),名為“文心一言”,英文名為ERNIE Bot。在內(nèi)測完成后,將向公眾開放。不同的是,該工具將初始版本內(nèi)嵌入搜索服務(wù)中,允許用戶通過對話式方式獲得搜索結(jié)果。
百度的CEO李彥宏在去年9月判斷人工智能的發(fā)展將有“技術(shù)層面和商業(yè)應(yīng)用層面的方向性改變”。盡管沒有首先推出ChatGPT,但百度具備了人工智能所需的算力、算法和數(shù)據(jù),在芯片、框架、模型和應(yīng)用四個技術(shù)方面都有布局,是國內(nèi)少數(shù)擁有全棧AI能力的公司。
相比百度的技術(shù)研發(fā)儲備,阿里和字節(jié)跳動可能是另外兩個較早布局的玩家。
2月9日,阿里的達摩院版ChatGPT在內(nèi)測中預(yù)先曝光。該新產(chǎn)品具備多種功能,包括知識問答、人工智能繪畫、代碼生成、小說續(xù)寫、文案撰寫和寫詩作詞等。在人工問答的水平方面,達摩院版ChatGPT已經(jīng)實現(xiàn)了相對真實的回答,同時也能實現(xiàn)多輪問答。
實際上,在2022年5月,阿里公布了相應(yīng)的能力,在AIGC方面,隨著超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的發(fā)布,生成的實景圖片已經(jīng)非常逼真。
阿里現(xiàn)已推出了M6芯片,支持十萬億的模型參數(shù)規(guī)模,平均單卡可承載200億參數(shù),同等參數(shù)規(guī)模能耗僅為前業(yè)界標桿的1%,大大降低了大模型訓(xùn)練的門檻。
字節(jié)動態(tài)正在研發(fā)ChatGPT,雖然全棧技術(shù)不是非常出色,但在商業(yè)應(yīng)用方面有很大的前瞻性。字節(jié)動態(tài)從去年開始研發(fā)類ChatGPT項目,現(xiàn)在已經(jīng)在內(nèi)部上線了測試插件,由AI實驗室主導(dǎo),還在探索當中。此外,字節(jié)動態(tài)的AML團隊也開發(fā)了veGiantModel模型,類似于為ChatGPT提供支持的GPT-3.5系列模型。
字節(jié)動態(tài)早就著手研究基于GPT2和GPT3的訓(xùn)練模型和產(chǎn)品,在NLP領(lǐng)域也有許多研究積累。目前,字節(jié)動態(tài)在對話機器人、機器翻譯、機器寫作方面有多項研究,特別是內(nèi)容創(chuàng)作方面。在ChatGPT用于寫文章之前,字節(jié)動態(tài)就研發(fā)了Xiaomingbot自動寫稿平臺,從2016年上線以來,已經(jīng)寫了60萬篇文章,覆蓋了17場體育賽事,支持6種語言。
近日,快手也宣布正在大力研究大型語言模型(LLM),并已經(jīng)啟動了相關(guān)項目,涵蓋了LLM模型的訓(xùn)練、文字自動創(chuàng)作和生成、對話系統(tǒng)的開發(fā)等領(lǐng)域。
另外,京東云的言犀也宣布將推出工業(yè)版的ChatGPT:ChatJD,其參數(shù)量預(yù)計為千億級別,主要應(yīng)用于零售和金融兩個領(lǐng)域。
2.國內(nèi)大廠為何沒能搶得先機?
近幾年,大量的大公司和研究機構(gòu)加入了人工智能領(lǐng)域,但真正有實力的玩家并不多。估測訓(xùn)練1750億參數(shù)的GPT-3語言模型需要上萬個CPU/GPU,持續(xù)輸入數(shù)據(jù)24小時,而且一次運算就需要450萬美元,能耗相當于開車往返地球和月球。因此,主流的大型語言模型只能被大型科技公司和少數(shù)研究機構(gòu)掌握。
從參數(shù)數(shù)量上看,國內(nèi)百度的文心模型有2600億參數(shù),高于GPT-3的1700億參數(shù),但參數(shù)數(shù)量不能代表模型的效果。國內(nèi)公司如百度和字節(jié)跳動擁有大量數(shù)據(jù)積累,但數(shù)據(jù)清洗、標注、模型設(shè)計、訓(xùn)練和推理等需要時間積累,這可能是國內(nèi)模型效果不如國外的重要原因。
關(guān)鍵時間點是2020年年中,GPT3.0剛剛推出。據(jù)流傳的專家紀要,很多人認為GPT3.0不僅代表了技術(shù),也是人工智能模型發(fā)展的新理念,因為開發(fā)商OpenAI對此具有獨到的見解,領(lǐng)先于國外的Google,國內(nèi)公司比OpenAI晚了兩年。
許多科技企業(yè)認為,ChatGPT并不是一種革命性的技術(shù)。它是OpenAI對GPT-3模型進行微調(diào)后開發(fā)出的對話機器人,并未實現(xiàn)底層模型的重大突破,只是通過理解、生成和交些相結(jié)合的方式,基于人類反饋進行強化訓(xùn)練,從而帶給人們智能的體驗感。
Meta首席人工智能科學家Yann LeCun也曾表達過對ChatGPT的看法,他認為它并沒有什么特別的創(chuàng)新,許多研究實驗室都在使用同樣的技術(shù)。
很多互聯(lián)網(wǎng)企業(yè)沒有意識到ChatGPT對現(xiàn)有搜索模式的顛覆,也沒有準確預(yù)測到ChatGPT對腦力勞動者產(chǎn)生替代的關(guān)系。他們認為“聊天”只是一種淺層的應(yīng)用,僅僅是一個更強的聊天機器人,現(xiàn)階段并不能看到其商業(yè)的潛力。
同樣的觀點還包括字節(jié)的NPL算法工程師,他認為ChatGPT是一個不確定性極高的項目,國內(nèi)尚未有成功的先例。如果決定全力以赴,很難獲得資源支持,更別說提高優(yōu)先級了。因為國內(nèi)的技術(shù)能力有限,缺少人力、資金和基礎(chǔ)模型,對于互聯(lián)網(wǎng)大廠這種商業(yè)公司而言,有著較大的難度。
造成的結(jié)果表現(xiàn)在不僅認知層面存在局限,在技術(shù)上也有所局限。ChatGPT 的信息截至 2021 年,這意味著它無法提供實時信息?,F(xiàn)在,百度正在努力解決信息實時性問題。與此同時,ChatGPT 已經(jīng)在準備推出基于 GPT-4 的新產(chǎn)品,國內(nèi)企業(yè)也有了新的目標需要實現(xiàn)。
3.跟風熱潮中,誰在硬蹭熱點?
前阿里云大模型負責人楊紅霞評論了目前互聯(lián)網(wǎng)公司熱衷于做ChatGPT的現(xiàn)狀。她表示:“僅有參數(shù)規(guī)模達到100B以上的大模型才有足夠的實力來提供高質(zhì)量的對話回答?!?/p>
根據(jù)這個標準,百度的飛槳平臺和文心大模型、阿里的“通義”大模型以及華為的鵬城盤古大模型都有較高的實力。而360、網(wǎng)易有道以及學而思等企業(yè)目前技術(shù)研發(fā)水平和進度較差,缺乏相應(yīng)的大模型和技術(shù)儲備。
此外,還有一些企業(yè)被認為是跟隨潮流追風口,比如漢王科技。根據(jù)半年報,該公司相關(guān)的文本大數(shù)據(jù)業(yè)務(wù)營收僅占總營收的14%,同比還有下降趨勢。然而,該公司卻通過炒作ChatGPT概念實現(xiàn)了股價的暴漲。
近期,越來越多的企業(yè)都在積極使用ChatGPT技術(shù)來提升自身業(yè)務(wù)。然而,也有一些企業(yè)并沒有采取任何行動,但卻受益于ChatGPT熱潮。2月8日,微軟推出了集成了ChatGPT技術(shù)的新版必應(yīng),其回答內(nèi)容中不少答案來自知乎,該天下午知乎的股價一度漲幅超過56%。由于ChatGPT可能對社區(qū)問答造成深遠影響,知乎方面一直對ChatGPT相關(guān)事宜保持沉默。但市場對其仍然熱愛,帶動了股價的增長。
有業(yè)內(nèi)人士表示,許多中小型企業(yè)缺乏技術(shù)實力,但也可以利用開源的Transformer大模型,在一定程度上實現(xiàn)ChatGPT的功能。
然而,達摩院專家表示,目前大規(guī)模預(yù)訓(xùn)練的基于Transformer的模型雖然能很好地解決感知智能相關(guān)任務(wù),但由于缺乏精心設(shè)計的純Transformer模型,基本無法實現(xiàn)認知智能。
正如字節(jié)跳動的情況,火山引擎的售前支持人員也表示,該平臺尚未推出類似產(chǎn)品,但可以通過機器學習平臺與自家產(chǎn)品結(jié)合,經(jīng)過二次開發(fā),能夠?qū)崿F(xiàn)類ChatGPT的效果。
4.尾聲
AIGC尤其是目前的ChatGPT確實是非常重要的新方向,不像之前談元宇宙很多人不認可、談28nm落地很多人搖頭、談國產(chǎn)操作系統(tǒng)大家尷尬一笑,經(jīng)過這段時間發(fā)酵,和AI相關(guān)的上下游企業(yè)都是非常緊張而且重視的態(tài)度。
AI產(chǎn)業(yè)的成熟,是大家目前極少數(shù)能看清的,可以提升整個社會生產(chǎn)效率的可落地工具,也就是很多年不再提升的全要素生產(chǎn)率,能再上一個臺階的最大希望(很多人原本期待L4自動駕駛會先落地),經(jīng)濟增長越慢大家才越內(nèi)卷,AI有可能會讓經(jīng)濟增速上一個臺階。這個方向是幾乎不可能被放棄的,對于互聯(lián)網(wǎng)頭部企業(yè)而言,如果這一次的機遇無法把握住,那么像新巨頭字節(jié)之前用算法(當時的最新工具)顛覆老巨頭百度這種事情也會有很大概率再次上演,這也是各家非常緊張的真實原因。
但是實際來看,也能理解這里算法、算力、數(shù)據(jù)三個方面的要求都是極高的,所以嚴格意義上只有巨頭能做。從事實出發(fā),我們不能發(fā)現(xiàn),現(xiàn)在連足夠算力的先進制程AI芯片都不夠,目前大家能想到的妥協(xié)方案是用CPU來頂。所以小公司撐不起全譜系A(chǔ)I研發(fā),大概率仍舊是接入端口部署應(yīng)用,包括最后國內(nèi)能活下來的AI平臺,可能也就是兩至三家;
如果類比AI產(chǎn)業(yè)對于,就如8年前伊始的新能源汽車,有兩三年的技術(shù)代差,但是核心技術(shù)沒有實質(zhì)性壟斷、沒有專利權(quán)鐵桶、沒有制造業(yè)上的硬門檻,目前對于國內(nèi)最尷尬的是算力芯片的困局,但是在其他領(lǐng)域(數(shù)據(jù)源、人工標注、中文語境)是有比較優(yōu)勢的,有點像當年新能源車里我們有(國內(nèi)市場、人工、電池、補貼)這些優(yōu)勢一樣。希望是靠著補貼、市場容量、制造業(yè)優(yōu)勢(這次是數(shù)據(jù)源優(yōu)勢),能彎道超車,起碼不落后。
包括騰訊、阿里、字節(jié)、小紅書、菜鳥等互聯(lián)網(wǎng)公司,已經(jīng)在NPL算法工程師等相關(guān)招聘崗位中,加入了從業(yè)者需了解熟悉GPT-3等相關(guān)模型的要求。而招聘的月薪多在4萬元左右,最高可達10萬元。
2023年,ChatGPT點燃的這把火,可以淬煉出真金的企業(yè)和人才,也可以蒸發(fā)掉虛妄的概念。最后想說的是,ChatGPT是開胃菜,GPT4.0才是大餐。